بهبود عملکرد دسته بندی متون و اسناد فارسی با استفاده از روش pca و ترکیب الگوریتم های جستجوی تکاملی
پایان نامه
- وزارت علوم، تحقیقات و فناوری - دانشگاه پیام نور - دانشگاه پیام نور استان تهران - دانشکده مهندسی برق و کامپیوتر
- نویسنده هادی رمضانی
- استاد راهنما احمد فراهی
- سال انتشار 1392
چکیده
با وجود حجم بالای اطلاعات متنی، نیازمند سیستمی کارا جهت دسته بندی خودکار متون داریم. بنابراین، باید دسته بندی را طوری انجام داد که ضمن افزایش دقت، سبب کاهش زمان و هزینه شود. فرایند دسته بندی متون دارای گامهای پیش پردازش، وزن دهی، کاهش ویژگی و دسته بندی است که برای هر گام روشهای مختلفی تا کنون ارائه شده است. یکی از گامهای تعیین کننده در دسته بندی، کاهش ویژگیها است. این موضوع در زبان فارسی به دلیل وجود ویژگیهای زیاد و تکراری و دارای معانی نزدیک، فرایندی با پیچیدگی قابل ملاحظهای میباشد. با توجه به اهمیت این موضوع، ایده اصلی ما بهبود عملکرد از طریق استخراج بهترین ویژگیها از متون فارسی است که برای این منظور به ارائه روشی با استفاده از تجزیه و تحلیل مولفههای اصلی (pca)و روش ترکیبی، از دو الگوریتم مطرح جستجوی تکاملی genetic و pso پرداختیم، بدین ترتیب میتوان از مزیت جستجوی سراسری در genetic و و قابلیت جستجوی موضعی در pso جهت کاهش ویژگیهای استخراج شده با هم تجمیع کرد و برای افزایش دقت و کاهش زمان محاسباتی به کار برد. نتایج حاصل از به کارگیری روش پیشنهادی نشان دهنده بهبود عملکرد و کاهش مدت زمان قابل توجهی در تست، بر روی متون فارسی با روش دسته بندی نزدیکترین همسایه میباشد. همچنین در مقایسه با روشهای مشابه، روش ارائه شده عملکرد بهتری از خود نشان داده است. این موضوع در زبان فارسی به دلیل وجود ویژگیهای زیاد و تکراری و دارای معانی نزدیک، فرایندی با پیچیدگی قابل ملاحظهای میباشد. با توجه به اهمیت این موضوع، ایده اصلی ما بهبود عملکرد از طریق استخراج بهترین ویژگیها از متون فارسی است که برای این منظور به ارائه روشی با استفاده از تجزیه و تحلیل مولفههای اصلی (pca)و روش ترکیبی، از دو الگوریتم مطرح جستجوی تکاملی genetic و pso پرداختیم، بدین ترتیب میتوان از مزیت جستجوی سراسری در genetic و و قابلیت جستجوی موضعی در pso جهت کاهش ویژگیهای استخراج شده با هم تجمیع کرد و برای افزایش دقت و کاهش زمان محاسباتی به کار برد. نتایج حاصل از به کارگیری روش پیشنهادی نشان دهنده بهبود عملکرد و کاهش مدت زمان قابل توجهی در تست، بر روی متون فارسی با روش دسته بندی نزدیکترین همسایه میباشد. همچنین در مقایسه با روشهای مشابه، روش ارائه شده عملکرد بهتری از خود نشان داده است.
منابع مشابه
ارائه ی یک مدل جهت دستهبندی متون فارسی با استفاده از ترکیب روش های دسته بندی
برای دستهبندی متن از تکنیکهای استخراج اطلاعات، پردازش زبان طبیعی و یادگیری ماشین به طور وسیع استفاده میشود به طور کلی هدف یک دسته بند متون، دستهبندی اسناد در قالب تعداد معینی از دستههای از پیش تعیین شده میباشد. هر سند میتواند در یک، چند و یا هیچ دستهای قرار بگیرد. در مورد هر سند به این سؤال پاسخ داده خواهد شد که این سند در کدام یک از دستهها قرار میگیرد. این موضوع میتواند در قالب یک ی...
متن کاملارائه ی یک مدل جهت دستهبندی متون فارسی با استفاده از ترکیب روش های دسته بندی
برای دستهبندی متن از تکنیکهای استخراج اطلاعات، پردازش زبان طبیعی و یادگیری ماشین به طور وسیع استفاده می شود به طور کلی هدف یک دسته بند متون، دستهبندی اسناد در قالب تعداد معینی از دستههای از پیش تعیین شده میباشد. هر سند می تواند در یک، چند و یا هیچ دسته ای قرار بگیرد. در مورد هر سند به این سؤال پاسخ داده خواهد شد که این سند در کدام یک از دستهها قرار می گیرد. این موضوع می تواند در قالب یک ی...
متن کاملدسته بندی اهداف سوناری با استفاده از روش ترکیبی ازدحام ذرات و جستجوی گرانشی
با توجه به خصوصیات فیزیکی بسیار نزدیک اهداف واقعی و کلاترِ سونار فعال، تفکیک این اهداف، از موضوعات چالشبرانگیز محققان و صنعتگران حوزه آکوستیک میباشد. شبکههای عصبی چندلایه (MLP) یکی از پرکاربردترین شبکههای عصبی در دستهبندی اهداف دنیای واقعی هستند. آموزش از مهمترین بخشهای توسعه این نوع شبکه ها است که در سالهای اخیر بسیار مورد توجه قرار گرفته است. به منظور آموزش شبکههای MLP از دیر باز استف...
متن کاملThe Study of Stressful Factors in Clinical Education for Nursing Students Studying in Nursing and Midwifery College in Khorramabad
کچ هدي پ شي مز هني فده و : شزومآ لاب يني شخب ساسا ي شزومآ مهم و راتسرپ ي تسا . و هنوگ ره دوج لکشم ي شزومآ رد لاب يني ، آراک يي هدزاب و ا ني شزومآ زا شخب راچد ار لکشم م ي دنک . فده اب رضاح شهوژپ سررب ي لماوع سرتسا از ي شزومآ لاب يني رد وجشناد ناي راتسرپ ي هدکشناد راتسرپ ي و يامام ي ماـجنا داـبآ مرـخ تسا هتفرگ . شور و داوم راک : رضاح هعلاطم کي هعلاطم صوت يفي عطقم ي تسا . د...
متن کاملThe effect of cyclosporine on asymmetric antibodies and serum transforming growth factor beta1 in abortion-prone model of mice CBA/J x DBA/2
كچ ي هد فده و هقباس : ي ک ي طقس زورب للع زا اه ي ،ررکم ا لماوع تلاخد ي ژولونوم ي ک ا رد ي ن قم طققس عون ي وراد دقشاب ي س ي روپسولک ي ،ن ح لدم رد طقس شهاک بجوم ي ناو ي CBA/j×DBA/2 م ي تنآ ددرگ ي داب ي اه ي ان و راققتم TGF-β لماوع زا عت مهم يي ن گلماح تشونرس هدننک ي سررب روظنم هب رضاح هعلاطم تسا ي ات ث ي ر اس ي روپسولک ي ن م رب ي از ا ي ن تنآ عون ي داب ي س و اه ي اکوت ي ن TGF...
متن کاملبهینهسازی فرایند ترکیب تصاویر با استفاده از الگوریتم جستجوی گرانشی
از آنجا که به دلیل محدودیتهای عکسبرداری نمیتوان با گرفتن تنها یک عکس از یک صحنه به تصویری با کیفیت و وضوح مطلوب دست یافت، ترکیب تصاویر با استفاده از روشهای گوناگون روز به روز در حال گسترش و بهبود است. از طرفی امروزه از الگوریتمهای جمعیتی مبتنی بر تصادف جهت بهینهیابی استفاده گستردهای میشود که اغلب با الهام از فرایندهای فیزیکی یا رفتارهای موجودات به وجود آمدهاند. الگوریتم بهینهیابی جست...
متن کاملمنابع من
با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید
ذخیره در منابع من قبلا به منابع من ذحیره شده{@ msg_add @}
نوع سند: پایان نامه
وزارت علوم، تحقیقات و فناوری - دانشگاه پیام نور - دانشگاه پیام نور استان تهران - دانشکده مهندسی برق و کامپیوتر
میزبانی شده توسط پلتفرم ابری doprax.com
copyright © 2015-2023